방법을 사용하기로 한다.
2) TreeTree를 통한 분석에서 모델은 몇 가지 방법에 의해 평가되는데 그 기준이 되는 방법에는
Entropy 지수, Gini 지수, 카이제곱 통계량, Deviance 등 이 있다. 어떤 기준을 선택하여 Tree 분석을 할지 결정키 위해 위의 기준들을 이용해 반복적으로 오분류율을 구해보았다.
총 38개의 변수 중 Age가 가장 큰 영향력을 끼치는 변수로 판별되었다.
그 다음은 KM, Weight 순으로 나왔다.
여러 가지 AOV16변수들 중에 Quaterly_Tax는 원 변수와 차이가 많이 나기 때문에 비선형성을 갖고 있다고 판단 할 수 있다.
따라서 Logit Regression을 하되, Linear Regression도 하여 그 둘을 비교해보도록
Ⅰ 서 론-사람의 삶과 연관된 통증
세상살이의 고통과 신체적 통증은 누구나 태어나서부터 사망할 때까지 겪게 되는 증상일 것이다. "인생은 고통" 이라고 표현할 때도 세상살이의 힘듦을 통증이라고 말하고 있으며 과히 일생동안의 생활이 라는 곳은 결국 통증과 동반하며 사는 것이라고 할 수 있을
Ⅰ. 개요
양극화 현상이 지니는 이미지는 과장된 것이지만, 양극화 추세를 보여주고 있는 것이 오늘의 한국사회라는 점을 실증적 자료를 중심으로 논의하고자 하였다. 다른 하나는 비교적인 관점에서 불평등을 분석하고자 하였다. 한국의 불평등이 실제로 어떤 정도인기를 파악하기 위해서 국제통계
주말까지 쓸 물건을 화요일날 구매하는 보통의 젊은 부부들은 어린 자녀를 위해 일회용 기저귀를, 그리고 주말 TV 시청시 가장이 마실 음료로 맥주를 동시에 구매하고 있는 것이다.
따라서 상품의 진열 시에 기저귀와 맥주를 가까이 진열하는 것을 포함해서 유아용품과 맥주와 함께 먹기 좋은 감자칩
Regression : 어떤 속성이 다른 속성에 의하여 설명되어지는 관계성을 분석하여, 새로운 사례에 대하여 이러한 속성치를 예측할 수 있는 모델을 구축한다. 예를 들면, 콜센터에서 콜의 빈도와 사용 코드 난이도의 관계성을 찾아 상담을 문의한 고객에게 문의 내용을 미리 예측하여 적절한 안내원이 응대할
I. Introduction
Nowadays, the economic change, high degree of competition, and the risk of businesses are getting severe. So we have to remember the importance of a marketing strategy to achieve superiority of the business administration. An efficient marketing strategy comes from marketing planning, execution, and control based on precise marketing informations.
Therefore, the marketing inform
제1장 데이터마이닝의 개요
1. 데이터마이닝의 정의
1956년 미국의 어느 조그만 마을에 작은 전파상을 운영하는 밀러라는 사람이 있었다. 이 전파상은 수 대에 걸쳐서 내려오는, 그 주위의 여러 다른 마을에도 소문이 난 유명한 가게였다. 물론 주위에는 여러 개의 전파상이 있었지만 유독 밀러씨
[4] 의사결정나무(Decision Trees)
의사결정나무(Decision Trees)는 분류 또는 예측을 목적으로 하는 어떤 경우에도 사용될 수 있는 기법으로 분석의 정확도보다는 분석과정의 설명이 필요한 경우에 더 유용하게 사용
(1) 세분화(Segmentation)
데이터를 비슷한 특성을 갖는 몇 개의 그룹으로 분할하여 각 그룹별